Хакатоны DST SkillFactory: DST-HACK

HACK-1. ЯНДЕКС.ЕДА


Команда DST-OFF // Hack.Eda: SF+Y.E - Team-03

Содержание

Импорт библиотек

Функции для анализа

Загрузка данных

Первичный предварительный анализ данных позволил сделать следующие выводы:

Обзор содержимого датасета

Так как количество городов для каждого ресторана не превышает одного, то каждый ресторан находится только в одном городе

Номера заказов не повторяются

В эксперименте по доставке мультизаказов участвовало только 99 ресторанов в одном городе, задействовано 209 курьеров

Итоги предварительного обзора:

Предварительный анализ датасета

Отделяем первые и вторые заказы для анализа

Соединяем обратно и добавляем колонку с разницей во времени между заказами

Выявление критериев

Вывод из графика:

Предобработка

Преобразуем данные к наиболее удобному виду

Для удобства повторного запуска предобработки инициализируем датасет
Занесем самовывоз как отдельного курьера с кодом '007'
Даты переведем из строк в datetime для проведения расчетов
Проведем перекодировку полей бренды, рестораны, курьеры, города в числовой формат для последующего анализа

Количество ресторанов c учетом самовывоза - 1098, без учета 1085

Количество курьеров - 9053, добавлен виртуальный курьер для заказов без указания курьера

Количество городов - 32

Перекодируем заказы по времени создания

Добавление новых полей

Удаление лишних полей

Посмотрим на предобработанный датасет

Глубокий анализ

Расчет

Результат